V2EX  ›  英汉词典

Distribution Drift

定义 Definition

distribution drift(分布漂移)指:在机器学习/数据分析中,输入数据或目标数据的概率分布随时间、环境或采样方式变化,导致模型在训练时学到的规律与实际运行时不再一致,从而可能引发性能下降。常见于线上系统、传感器数据、用户行为变化、业务策略调整等场景。(相关术语还有 data driftconcept drift 等,侧重点略有不同。)

发音 Pronunciation (IPA)

/ˌdɪstrɪˈbjuːʃən drɪft/

例句 Examples

The model failed because of distribution drift in the input data.
模型失败是因为输入数据发生了分布漂移。

After the new policy rolled out, subtle distribution drift changed customer behavior patterns, so the team retrained the model and added drift monitoring.
新政策上线后,细微的分布漂移改变了客户行为模式,因此团队重新训练模型并加入了漂移监控。

词源 Etymology

distribution 源自拉丁语 distribuere(“分配、散布”),在统计学中引申为“(概率)分布”;drift 源自古诺尔斯语 drífa(“漂流、被推动”),表示“缓慢偏移”。组合起来,distribution drift 直观表达“分布在不知不觉中发生偏移”。

相关词 Related Words

文学/著作中的使用 Literary Works

  • Designing Machine Learning Systems(Chip Huyen)——讨论线上模型的监控与数据/分布漂移(distribution drift)等问题。
  • Machine Learning Design Patterns(Lakshmanan, Robinson, Munn)——在生产环境模式中涉及数据分布变化与漂移监测。
  • Data Science for Business(Provost & Fawcett)——在“数据随环境变化导致模型失效”的语境下讨论类似的分布变化问题(常与 dataset shift/概念漂移并提)。
关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   1729 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 15ms · UTC 05:11 · PVG 13:11 · LAX 21:11 · JFK 00:11
♥ Do have faith in what you're doing.